\section{用基计算}%\textbullet 基变换与坐标变换}


\begin{frame}{本节概要}
  \begin{enumerate}
    \item 通过定义向量组与 (元素为数的) 列向量的乘积，
      我们能用类似于矩阵乘积的形式来写线性组合$\sum_{i=1}^s a_i \alpha_i$.  这能为书写和运算带来方便。
      更一般地，我们可以定义向量组与 (元素为数的) 矩阵的乘积，
      这样得到一个新的向量组，新的向量组可由原向量组线性表出。
      这样的定义有类似于矩阵的乘法的性质，也满足结合律和与加法的分配律。
    \item 在几何中，坐标变换是基本的操作。例如，我们常用此来规范化 (如为了获得更简洁、更方便的形式)。
      给定一个有限维线性空间的两组基$\symbb{B}$和 $\symbb{B}'$,
$\symbb{B}'$可写为$\symbb{B}$与一个矩阵的乘积，这个矩阵是
$\symbb{B}'$中向量在基$\symbb{B}$下的坐标按照列向量的形式依次拼成的。
这个矩阵是唯一的，因为向量在基下的坐标是唯一的；
这个矩阵就称为基$\symbb{B}$到基$\symbb{B}'$的过渡矩阵或基变换矩阵。
把基$\symbb{B}, \symbb{B}'$分别想作旧基、新基，
则新基 $=$ 旧基 $\times$ 过渡矩阵。
\item 当我们做基的变换时，一个向量的新、旧坐标如下联系：
新坐标 $=$ 过渡矩阵的逆 $\times$ 旧坐标。
这里的新坐标、旧坐标分别是指在新基、旧基下的坐标。
\item 我们还会讲到过渡矩阵恰为可逆矩阵：
过渡矩阵是可逆矩阵；而
若$\symbb{B}$是有限维线性空间的一组基，那么其他基都形如$\symbb{B} A$, 其中$A$是可逆矩阵 (阶等于空间的维数)。
因此，取定一组基 $\symbb{B}$ 后，我们可以得到所有基与可逆矩阵的一一对应：
一组基$\symbb{B}'$对应于固定的基$\symbb{B}$到该基$\symbb{B}'$的过渡矩阵。
  \end{enumerate}
\end{frame}

\begin{frame}{向量组与数字矩阵的乘积}
  我们能用类似于矩阵乘积的形式来写线性组合$\sum_{i=1}^s a_i \alpha_i$.  这能为书写和运算带来方便。

  \pause
  定义向量组$S=(\alpha_1, \alpha_2, \cdots, \alpha_s)$与列向量$X=(a_1, a_2, \cdots, a_s)^{\rT}\in P^{(s)}$的\emph{乘积} (product) 为
\begin{equation*}
  SX=(\alpha_1, \alpha_2, \cdots, \alpha_s)\begin{pmatrix}a_1\\ a_2\\ \vdots\\ a_s\end{pmatrix}
  \coloneq \sum_{i=1}^s \alpha_i a_i = \sum_{i=1}^s a_i \alpha_i.
\end{equation*}
这个乘法规则显然跟通常的行向量与列向量的乘法规则一样。
\pause
进一步，给定矩阵$A=\begin{pmatrix}
    \beta_1 & \beta_2 & \cdots&  \beta_t
\end{pmatrix}\in P^{s\times t}$, 
定义一个新向量组
\begin{equation*}
  SA=(S\beta_1, S\beta_2, \cdots, S\beta_t).
\end{equation*}
\pause
容易发现结合律也成立，即若还有$B\in P^{t\times p}$, 则
\[
  (SA)B=S(AB).
\]
另外，我们也有分配律：
\[
  SA+SA'=S(A+A'),\quad (S+S')A=SA+S'A,
\]
其中$S, S'$是包含相同多向量的向量组，$A, A'$是同阶矩阵；
$S, S'$的加法是按分量相加，
即形如
\[
  (\alpha_1, \cdots, \alpha_s)+(\beta_1, \cdots, \beta_s)\coloneq
  (\alpha_1+\beta_1, \cdots, \alpha_s+\beta_s).
\]
\end{frame}


\begin{frame}
有了上面的记号，我们可以重述线性关系的一些概念：
\begin{enumerate}
\item 向量$\beta$可由向量组$S=(\alpha_1, \cdots, \alpha_s)$线性表出相当于
存在列向量$X\in P^{(s)}$使得$\beta=SX$. 
\pause
\item 更一般地，向量组$T$可由向量组$S$线性表出相当于存在数字矩阵$A$使得$T=SA$. 
  线性表出的传递性可如下得到：若$S_1$可由$S_2$线性表出，$S_2$可由$S_3$线性表出，
  则存在矩阵$A_1, A_2$使得$S_1=S_2A_1, S_2=S_3A_2$, 
  从而
  \[
    S_1=S_2A_1=(S_3 A_2) A_1 =S_3(A_2A_1).
  \]
  这样$S_1$可由$S_3$线性表出。

  \pause
\item 向量组$S=(\alpha_1, \cdots, \alpha_s)$线性无关相当于$SX=0$（其中$X\in P^{(s)}$）蕴含了$X=0$. 
\end{enumerate}

\end{frame}


\begin{frame}
  \begin{example}
    令$V$为上三角的$2$阶方阵构成的集合。
容易发现$V$在矩阵的加法和数乘下构成向量空间，且
    \[
      e_{11}=\begin{pmatrix}
        1 & 0\\ & 0
      \end{pmatrix},\quad
      e_{12} =\begin{pmatrix}
        0 & 1 \\ & 0
      \end{pmatrix},\quad
      e_{22}=\begin{pmatrix}
        0 & 0 \\ & 1
      \end{pmatrix}
    \]
    构成其一组基，记为$\symbb{B} $. 
    特别地， $\dim V=3$. 
    \pause
    令
          \begin{align*}
        M_1=  \begin{pmatrix}
        1 & 1 \\
        & 1
      \end{pmatrix}, \quad
      M_2=  \begin{pmatrix}
        1 & 2 \\ & 0
      \end{pmatrix}, \quad
      M_3=  \begin{pmatrix}
        1 & 0 \\ & 3
      \end{pmatrix}
    \end{align*}
记$\symbb{B} '=(M_1, M_2, M_3)$. 
    容易发现
    $\symbb{B} '=\symbb{B} A$, 其中
    \[
      A=\begin{pmatrix}
        1   & 1 & 1\\
        1 & 2 & 0 \\
        1 & 0 & 3
      \end{pmatrix}.
    \]
    \pause
    由于$A$可逆，$\symbb{B} =\symbb{B} 'A^{-1}$.
    由线性表出的传递性可知$\symbb{B} '$能生成$V$. 
    实际上，若$\alpha\in V$在基$\symbb{B} $下的坐标为$X$, 则
    \[
      \alpha= \symbb{B} X=\left( \symbb{B} ' A^{-1} \right)X = \symbb{B} ' (A^{-1}X).
    \]
    从而$\symbb{B} '$也是一组基。
    \pause
当然你也可以证明$\symbb{B} '$线性无关，这也归结到$A$的可逆性。
  \end{example}


\end{frame}


\begin{frame}{基变换与坐标变换}
设$V$是有限维向量空间，
$\symbb{B} =(\varepsilon_1,\varepsilon_2,\cdots, \varepsilon_n)$和$\symbb{B} '=(\varepsilon_1',\varepsilon_2',\cdots, \varepsilon_n')$是$V$的两组基。
$\symbb{B} , \symbb{B} '$之间如何关联？
$\xi\in V$在两组基下的坐标向量如何关联？
这就是我们下面要谈的基变换和坐标变换。

\pause
我们把$\symbb{B} $看作旧基，而$\symbb{B} '$视为新基。
既然$\symbb{B}$为生成集，$\symbb{B}'$可由$\symbb{B}$线性表出，
因此存在$n$阶数字方阵$A$使得$\symbb{B}'=\symbb{B}A$. 具体说来，
若$A=(a_{ij})\in P^{n\times n}$,
则$A$的第$j$列正是新基向量$\varepsilon_j'$用旧基$\symbb{B}$计算时的坐标向量：
%基$\symbb{B} '$中每个向量为基$\symbb{B} $中向量的线性组合：
\[
  \varepsilon_j'=\varepsilon_1a_{1j}+\varepsilon_2a_{2j}+\cdots+\varepsilon_na_{nj},
\]
即$A$为新基向量在旧基下的坐标向量拼成的。
%用旧基计算时，
%$A_j=(a_{1j}, a_{2j}, \cdots, a_{nj})^{\rT}$是新基向量$\varepsilon_j'$的坐标向量。
%令$A=\begin{pmatrix}
%  A_1 & \cdots & A_n
%\end{pmatrix}$, 我们可得$\symbb{B} '=\symbb{B} A$:
%\[
%  \symbb{B} '=(\varepsilon_1',\varepsilon_2',\cdots, \varepsilon_n')=(\varepsilon_1,\varepsilon_2,\cdots, \varepsilon_n)\begin{pmatrix}
%    A_1 & A_2 & \cdots & A_n
%\end{pmatrix}=\symbb{B} A.
%\]
$A$称为\emph{基变换矩阵} (basechange matrix) 或\emph{过渡矩阵} (transition matrix)。
我们有：\emph{新基 $=$ 旧基 $\times$ 过渡矩阵}。
稍后我们会证明过渡矩阵$A$是可逆矩阵。

\pause
对$\xi\in V$有$\xi=\symbb{B} X=\symbb{B} 'X'$, 其中$X, X'$分别为$\xi$在基$\symbb{B} , \symbb{B} '$下的坐标向量。
代入$\symbb{B} '=\symbb{B} P$可得
\[
  \symbb{B} X=(\symbb{B} A)X'=\symbb{B} (AX').
\]
由坐标向量的唯一性知$X=AX'$, 
从而
\[
  X'=A^{-1}X.
\]
这就是基变换下坐标变换的公式，
即：\emph{新坐标 $=$ 过渡矩阵的逆 $\times$ 旧坐标}。

\end{frame}

\begin{frame}
\begin{proposition}[{过渡矩阵恰为可逆矩阵}]
  \begin{enumerate}
    \item 令$\symbb{B} , \symbb{B} '$为$V$的两个基。
那么过渡矩阵$A$是可逆矩阵，且由基$\symbb{B} , \symbb{B} '$唯一确定。

    \item 令$\symbb{B} =(\varepsilon_1,\cdots,\varepsilon_n)$是$V$的一组基，那么其他基都形如$\symbb{B} '=\symbb{B} A$, 其中$A\in \GL_n(P)$.
  \end{enumerate}
\end{proposition}

\pause
\begin{proof}
  \begin{enumerate}
    \item $\symbb{B} '=\symbb{B} A$把基向量$\varepsilon_i'$表示为基$\symbb{B} $中向量的线性组合，这种写法是唯一的，
      所以$A$唯一。
      交换$\symbb{B} , \symbb{B} '$的角色知存在矩阵$A'$使得$\symbb{B} =\symbb{B} 'A'$. 
      这时
      \[
        \symbb{B} =\symbb{B} 'A'=(\symbb{B} A)A'=\symbb{B} (AA').
      \]
      因此$AA'=E$, $A$可逆。

    \item 只用证对基$\symbb{B} $和可逆矩阵$A$, $\symbb{B} '=\symbb{B} A$是基。
由$\symbb{B} =\symbb{B} 'A^{-1}$知$\varepsilon_i$可由$\symbb{B} '$表出, 从而$\symbb{B} '$生成$V$. 
        又$\symbb{B} '$包含$\dim V=n$个向量，我们可知$\symbb{B} '$为基。
  \end{enumerate}
\end{proof}

\pause
例如，由此可知，$P^n$中向量组$\symbb{B}=(\alpha_1,\cdots,\alpha_n)$为基当且仅当
\[
  A=\begin{pmatrix}
  \alpha_1 \\ \vdots \\ \alpha_n
\end{pmatrix}
\]
为可逆矩阵，因为$\symbb{B} =\symbb{E} A^{\rT}$, 
其中$\symbb{E}=(\varepsilon_1,\cdots,\varepsilon_n)$为自然基。
这个断言也可如下得到：$\symbb{B}$为基 $\Leftrightarrow$ $\symbb{B}$线性无关
$\Leftrightarrow$ $\rank_r A = n$ $\Leftrightarrow$ $\rank A =n$ (因为矩阵的行秩、秩相等)
$\Leftrightarrow$ $A$ 可逆。

\end{frame}

\begin{frame}

  \begin{example}\label{121}
  考虑已建立直角坐标系的$xOy$平面。
  我们有自然基$\symbb{B}=(\symbf{i}, \symbf{j})$, 其中
  \[
    \symbf{i}=(1,0), \quad \symbf{j}=(0,1).
  \]
  逆时针旋转坐标系$\theta$角度后我们得到新的坐标系，对应于新基
  $\symbb{B}'=(\symbf{i}', \symbf{j}')$,   其中
  \begin{wrapfigure}{r}{.3\textwidth}
    \begin{tikzpicture}[scale=.7]
    \path[rotate=60,name path=xprime] (0,0) -- (1,0);
    \path[name path=v] (.5,0) -- (.5,1);
    \path [name intersections={of=v and xprime}];
    \coordinate (x') at (intersection-1);
    \coordinate (i) at (1,0);
    \coordinate (O) at (0,0);
    \pic [draw=green!50!black, fill=green!20, angle radius=2.5mm,
    "$\theta$",angle eccentricity=1.8] {angle = i--O--x'};
    \draw[->] (-2,0) -- (0,0) node[below left, xshift=-2pt] {$O$} --(2,0) node[below] {$x$}; % x axis
    \draw[->] (0,-2)--(0,2) node[left] {$y$}; % y axis
    \draw[->,thick,green] (0,0) -- (1,0) node[below] {$\symbf{i}$};
    \draw[->,thick,green] (0,0) -- (0,1) node[left] {$\symbf{j}$};
    \draw[->,blue,rotate=60] (-2,0)--(2,0) node[right] {$x'$};
    \draw[->,blue,rotate=60] (0,-2)--(0,2) node[left] {$y'$};
    \draw[->,thick,red,rotate=60] (0,0) -- (1,0) node[above] {$\symbf{i}'$};
    \draw[->,thick,red,rotate=60] (0,0) -- (0,1) node[left, yshift=-3pt] {$\symbf{j}'$};
  \end{tikzpicture}
\end{wrapfigure}
  \[
  \begin{aligned}
    \symbf{i}'&= (\cos\theta, \sin \theta)=\cos\theta\; \symbf{i} + \sin\theta\; \symbf{j}, \\
        \symbf{j}'&= (-\sin\theta, \cos \theta)=-\sin\theta\; \symbf{i} + \cos\theta\; \symbf{j}.
      \end{aligned}
\]
\pause
  自然基$\symbb{B}$到基$\symbb{B}'$的过渡矩阵为旋转矩阵
  \[
   R= \begin{pmatrix}
      \cos\theta & -\sin \theta \\ \sin \theta & \cos\theta
    \end{pmatrix}.
  \]
平面上点$P$的旧坐标$(x,y)$与新坐标$(x',y')$的联系为
\[
  \begin{pmatrix}
    x \\ y
  \end{pmatrix} =R \begin{pmatrix}
    x' \\ y'
  \end{pmatrix}=\begin{pmatrix}
    x' \cos\theta -y' \sin\theta \\
x' \cos\theta +y' \sin\theta 
  \end{pmatrix}.
\]
这个公式我们已然在第四章的例~\ref{1BC}~中见过。

\end{example}
\end{frame}

  %\begin{example}[列向量空间中的过渡矩阵]
%$P^{(n)}$中向量组$S=(\beta_1, \beta_2, \cdots, \beta_n)$为基等价于$S$线性无关，进而等价于$\begin{pmatrix}
%    \beta_1 & \beta_2 & \cdots &\beta_n
%  \end{pmatrix}$是可逆矩阵。给定$P^{(n)}$的两组基
%  \[
%  \symbb{B} =(\beta_1, \beta_2, \cdots, \beta_n),\quad \symbb{B} '=(\beta_1', \beta_2', \cdots, \beta_n'), \]
%  设过渡矩阵为$A$. 令
%  \[
%    [\symbb{B} ]= \begin{pmatrix}
%    \beta_1 & \beta_2 & \cdots &\beta_n
%  \end{pmatrix},\quad [\symbb{B} ']= \begin{pmatrix}
%    \beta_1' & \beta_2' & \cdots &\beta_n'
%  \end{pmatrix}.
%  \]
%  那么$[\symbb{B} ],[\symbb{B} ']$是可逆矩阵。由$\symbb{B} '=\symbb{B} A$知$[\symbb{B} ']=[\symbb{B} ]A$, 这样$A=[\symbb{B} ]^{-1}[\symbb{B} ']$, 这就给出了我们想要的过渡矩阵。

  %讨论行向量空间可以通过转置在列向量空间中计算实现。
%  设
%  \[
%    (\alpha_1, \alpha_2, \cdots, \alpha_n),\quad (\alpha_1', \alpha_2', \cdots, \alpha_n')
%  \]
%  为$P^n$的两组基, 过渡矩阵为$P$. 那么
%  \[
%    \symbb{B} =(\alpha_1^{\rT}, \alpha_2^{\rT}, \cdots, \alpha_n^{\rT}),\quad
%    \symbb{B} '=((\alpha_1')^{\rT}, (\alpha_2')^{\rT}, \cdots, (\alpha_n')^{\rT}).
%  \]
%  为$P^{(n)}$的两组基。注意此时过渡矩阵仍为$P$. 所以$P=[\symbb{B} ]^{-1}[\symbb{B} ']$.

%一般的有限维线性空间$V$中，取定一组基后，我们可以给出同构$V\cong P^{(n)}.
%所有的计算都在 $P^{(n)}$中进行即可。
%\end{example}


\begin{frame}
  \begin{example}
    考虑$P^3$的自然基$\symbb{B} =(\varepsilon_1, \varepsilon_2, \varepsilon_3)$, 
    和两个向量组$\symbb{B} _1=(\xi_1, \xi_2, \xi_3)$, $\symbb{B} _2=(\eta_1,\eta_2, \eta_3)$,
    其中
    \[
      \begin{cases}
        \varepsilon_1=(1,0,0)\\
        \varepsilon_2=(0,1,0)\\
        \varepsilon_3=(0,0,1),
      \end{cases}\qquad
      \begin{cases}
        \xi_1=(1,1,1)\\
        \xi_2=(1,-1,1)\\
        \xi_3=(1,1,-1),
      \end{cases}\qquad
      \begin{cases}
        \eta_1=(1,1,0)\\
        \eta_2=(2,1,3)\\
        \eta_3=(1,1,1).
      \end{cases}
    \]
任意的$\alpha=(a_1,a_2,a_3)\in P^3$ 在自然基$\symbb{B} $下的坐标向量为
\[
  \alpha^{\rT}=(a_1,a_2,a_3)^{\rT},
\]
即$\alpha=\symbb{B} \alpha^{\rT}$.
\pause
这样
$\symbb{B} _1=\symbb{B} Q_1, \symbb{B} _2=\symbb{B} Q_2$, 
其中
\[
    \begin{aligned}
      Q_1&= \begin{pmatrix}
          \xi_1^{\rT} & \xi_2^{\rT} & \xi_3^{\rT}
        \end{pmatrix} = \begin{pmatrix}
          1 & 1 & 1 \\
          1 & -1 & 1\\
          1 & 1 & -1
        \end{pmatrix}, \\
        Q_2 &= \begin{pmatrix}
          \eta_1^{\rT} & \eta_2^{\rT} & \eta_3^{\rT}
        \end{pmatrix} =\begin{pmatrix}
          1 & 2 & 1\\
          1 & 1 & 1 \\
          0 & 3 & 1
        \end{pmatrix}.
    \end{aligned}
  \]
    $Q_1, Q_2$是可逆矩阵表明$\symbb{B} _1, \symbb{B} _2$都是$P^3$的基，
    且$Q_1, Q_2$分别为基$\symbb{B} $到基$\symbb{B} _1$、基$\symbb{B} $到基$\symbb{B} _2$的过渡矩阵。
  \end{example} 
\end{frame}



\begin{frame}
  \addtocounter{theorem}{-1}
\begin{example}[续]
    令$\alpha=(1,-1,0)\in P^3$. 
    $\alpha$在基$\symbb{B} $下的坐标为
    $X=\alpha^{\rT}$.
下面我们来算下基$\symbb{B} _1$到基$\symbb{B} _2$的过渡矩阵$A$及$\alpha$在基$\symbb{B} _1$下的坐标$X'$.
用自然基过渡下我们可以找到基$\symbb{B} _1$到基$\symbb{B} _2$的过渡矩阵$A$：
    \[
      \symbb{B} _2=\symbb{B} Q_2 = (\symbb{B} _1Q_1^{-1})Q_2= \symbb{B} _1(Q_1^{-1}Q_2),
    \]
    因而
    \[
      A=Q_1^{-1}Q_2. 
\]
\pause
另外，
    $\alpha$在基$\symbb{B} _1$下的坐标为$X'=Q_1^{-1}X$.
    行化简$\begin{pmatrix}
      Q_1 & Q_2 & X
    \end{pmatrix}$把$Q_1$化至单位矩阵可求出$A=Q_1^{-1}Q_2, X'=Q_1^{-1}X$：
    \[
      \left(\begin{array}{rrr|rrr|r}
          1 & 1 & 1 & 1 & 2 & 1& 1\\
          1 & -1 & 1 & 1 & 1 & 1 & -1\\
          1 & 1 & -1 & 0 & 3 & 1  & 0
    \end{array}\right)\longrightarrow 
    \left(\begin{array}{rrr|rrr|r}
        1 & 0 & 0 & \frac{1}{2} & 2 & 1 &-\frac{1}{2}\\
        0 & 1 & 0 & 0 & \frac{1}{2} & 0 & 1\\
        0 & 0 & 1 & \frac{1}{2} & -\frac{1}{2} & 0& \frac{1}{2}
    \end{array}\right),
    \]
    所以基$\symbb{B} _1$到基$\symbb{B} _2$的过渡矩阵和$\alpha$在基$\symbb{B} _1$下的坐标向量分别为
    \[
      A=\begin{pmatrix}
      \frac{1}{2} & 2 & 1 \\
      0 & \frac{1}{2} & 0\\
      \frac{1}{2} & -\frac{1}{2} & 0
    \end{pmatrix}, \quad 
    X'=\begin{pmatrix}
      -\frac{1}{2} \\ 1 \\
      \frac{1}{2}
    \end{pmatrix}.
    \]
  \end{example}

\end{frame}


\begin{frame}{小结}
  \begin{enumerate}
    \item 向量组与数字矩阵的乘法有哪些性质（想想矩阵的乘积有哪些性质）？
      如何借助此乘法描述我们说过的线性相关性的一些概念？
    \item 何谓过渡矩阵（或过渡矩阵）？
      如果已知有限维向量空间的一组基，其他基可如何表示？
    \item 坐标变换公式如何？何来？
  \end{enumerate}
\end{frame}
